# 了解基本信息

import pandas as pd

# 读取CSV文件
df = pd.read_csv('updated_pollution_dataset.csv')

# 显示DataFrame的概要信息
df.info()

# 显示DataFrame的描述性统计信息
print(df.describe())

# 检查重复值
duplicates = df.duplicated()
print("是否存在重复值：", duplicates.any())
print("重复值的数量：", duplicates.sum())